home *** CD-ROM | disk | FTP | other *** search
/ Power Tools 1993 November - Disc 2 / Power Tools Plus (Disc 2 of 2)(November 1993)(HP).iso / hotlines / gsyhl / rvsr / rvsr.txt < prev    next >
Text File  |  1992-09-01  |  31KB  |  698 lines

  1. COMPETITIVE ANALYSIS OF RISC ARCHITECTURES
  2.  
  3. Hewlett-Packard's PA-RISC Advantage versus other Competitive RISC Architectures
  4.  
  5.  
  6. .PA
  7. TABLE OF CONTENTS
  8.  
  9.  
  10. Executive Summary........................................  2
  11.  
  12.  
  13. The RISC Market..........................................  4
  14.  
  15.  
  16. Architecture versus Implementation.......................  7
  17.  
  18.  
  19. Hewlett-Packard's PA-RISC................................  8
  20.  
  21.  
  22. PA-RISC versus Other Competitive RISC Architectures...... 10
  23.  
  24.  
  25. Conclusion............................................... 14
  26.  
  27.  
  28. Appendix A............................................... 16
  29.  
  30.  
  31. Glossary................................................. 18
  32.  
  33.  
  34. Table 1:  PA-RISC Architecture Feature Comparison........ 20
  35.  
  36.  
  37. Table 2: PA-RISC Implementation Comparison............... 21
  38.  
  39. .PA
  40. Executive Summary
  41.  
  42. The purpose of this paper is to compare the differences between
  43. Hewlett-Packard's RISC (Reduced Instruction Set Computing)
  44. architecture, named Precision Architecture RISC (PA-RISC), and other
  45. competitive RISC architectures (Sun's SPARC, Mips RX000, IBM's POWER,
  46. and DEC's ALPHA) and to describe the implications of these
  47. architectural differences and what benefits they bring to HP's
  48. customers.
  49.  
  50. This paper discusses (in the following order):
  51.  
  52. *  the RISC market and its rapid growth over the last several years.
  53.  
  54. *  the relative importance of an architectural comparison, as opposed
  55. to a comparison of implementations.
  56.  
  57. *  HP's PA-RISC architecture design goals.
  58.  
  59. *  each of the architectures, from a high-level perspective, in a
  60. number of key architectural areas.
  61.  
  62. *  the overall relative strengths and weaknesses of each architecture.
  63.  
  64. RISC technology offers the potential for dramatic price/performance
  65. improvements over computers with traditional CISC (Complex Instruction
  66. Set Computing) technology.  Although computers based on RISC technology
  67. share some common architectural attributes, major design differences
  68. exist.  These architectural differences translate into performance,
  69. flexibility, and growth advantages for the customer who chooses the
  70. appropriate family of RISC processors.
  71.  
  72. In summary, HP 9000 Series 800 Business Servers and Series 700
  73. workstations, and HP 3000 Series 900 Business Systems are all based on
  74. HP's leading-edge RISC architecture.  PA-RISC is a carefully designed
  75. computer architecture that provides the following benefits over other
  76. competitive RISC architectures:
  77.  
  78. *  PA-RISC is the leader in performance.  PA-RISC's performance growth
  79. has been about 60% per year for the last 5 years.  Performance over the
  80. next 5 years is expected to grow even faster, closer to 75% per year.
  81.  
  82. *  PA-RISC is the most flexible architecture because it is designed for
  83. the commercial and technical environment.  With PA-RISC, HP offers
  84. products from the desktop to mainframes with 100% object-code
  85. compatibility, and is built for future needs.
  86.  
  87. *  PA-RISC is extensible so it can adapt to technology change.
  88.  
  89. *  PA-RISC supports over 4500 applications today.  It has thousands of
  90. leading edge applications across many industries in the commercial,
  91. manufacturing, engineering, and scientific markets.
  92.  
  93. *  HP's PA-RISC design requires fewer components, advanced VLSI
  94. technology, reduced number of boards for a single system, high
  95. reliability, and lower support costs.  This combination provides a
  96. measurable overall lower cost of computing compared with other
  97. competitive systems.  As a result, PA-RISC systems are smaller and and
  98. take up less floor space, consume less power, and require less cooling
  99. than competitive systems.
  100.  
  101. ..picturec:\risc\9000-116.gal,65535,49151,16,65,17,
  102.  
  103.  
  104. .PA
  105. The RISC Market
  106.  
  107.  
  108. Since the mid-1980s, RISC processors and systems have revolutionized
  109. the commercial computer market.  This technology has been accepted by
  110. all the major computer vendors:  HP, IBM, DEC, and Sun.  According to
  111. the RISC Management Newsletter, RISC-based system shipments have grown
  112. from $1.95 billion in 1988 to $18.5 billion in 1991.  RISC is not a
  113. fad.  It is a reality.
  114.  
  115. ..picturec:\risc\riscmkt.gal,65535,49151,16,65,17,
  116.  
  117. Of the leading computer vendors, HP started shipping PA-RISC based
  118. computers in 1986 followed by Sun/SPARC in 1987, DEC/Mips in 1989, and
  119. IBM/POWER in 1990.
  120.  
  121. ..picturec:\risc\timeline.gal,65535,49151,16,65,17,
  122.  
  123. All the major computer vendors have moved to RISC.  The reason is
  124. because RISC brings users value.  RISC provides higher performance at a
  125. dramatically lower cost in terms of $/MIP than CISC architectures.
  126.  
  127. ..picturec:\risc\movrisc.gal,65535,49151,16,65,17,
  128.  
  129. As a result of HP's early commitment to RISC and the viability of PA-
  130. RISC in commercial applications, HP is the leading RISC system vendor.
  131. According to Infocorp, HP has 31.1% of the 1991 worldwide RISC market
  132. share based on revenue dollars of RISC desktop and multiuser systems,
  133. Sun has 19.5%, IBM has 13.2%, and DEC has 11.8%.
  134.  
  135. ..picturec:\risc\riscpie1.gal,65535,49151,16,65,17,
  136.  
  137. Also according to Infocorp, HP has 51.3% of the 1991 worldwide
  138. multiuser RISC market share based on revenue dollars of RISC multiuser
  139. systems, DEC has 12.5%, Sun has 7.8%, and IBM has 5.8%.
  140.  
  141. ..picturec:\risc\riscpie4.gal,65535,49151,16,65,17,
  142.  
  143.  
  144. .PA
  145. Architecture versus Implementation
  146.  
  147. Various proposals for drawing the line between computer architecture
  148. and computer implementation exist.  The original definition defined the
  149. architecture to the instruction set and execution model.  All else
  150. makes up the implementation.  A broader definition sets the
  151. architecture as the instruction set and structure down to the
  152. functional modules of the system.  Various other definitions fall
  153. between these 2 extremes.
  154.  
  155. For our purposes, we will use the original definition.  In other words,
  156. we define the architecture as only software-visible features including
  157. the basic instruction set and memory management architectures.  It does
  158. not include the specification of functional modules used to implement
  159. these features.
  160.  
  161. The reasons for evaluating architecture instead of implementation are
  162. as follows.  Changing an architecture, in general, implies that changes
  163. will have to be made to user application software.  Since most computer
  164. vendors do not write all of their own applications and because of the
  165. enormous number of packages that would have to be updated, the cost of
  166. such a change is very high.  In some cases additions to an architecture
  167. could be made in such a manner that existing user application software
  168. is both forward- and backward-compatible.  In general, however, this is
  169. not the case, and the selection of a good architecture is critical.
  170.  
  171. Changes to an implementation imply that only changes to the hardware
  172. and possibly the operating system software will be necessary.  Since
  173. vendors upgrade both the hardware and operating system on a regular
  174. basis (to include latest chip implementations), the added cost of
  175. changes in an implementation remains small in comparison to the user
  176. software changes.  Any limitations in a given implementation can be
  177. reduced or circumvented in the next implementation.  Therefore, the
  178. selection of a RISC architecture based on a given implementation is not
  179. critical.
  180.  
  181. .PA
  182. Hewlett-Packard's PA-RISC
  183.  
  184. The primary RISC design goal is to increase processor efficiency by
  185. greatly reducing the average number of cycles expended per instruction.
  186. Researchers have found that reducing the complexity of the computer
  187. instruction set can lead to dramatic performance improvements, as well
  188. as reduced design and manufacturing costs.  The result is a computer
  189. architecture with price/performance advantages over traditional CISC
  190. architectures.
  191.  
  192. HP's PA-RISC is the result of one of the most exhaustive projects
  193. undertaken by a computer vendor.  The goal was to design an
  194. architecture that:
  195.  
  196. *  supports the commercial, scientific, and engineering environments.
  197.  
  198. *  supports both single-user and multiuser applications.
  199.  
  200. *  provides superior price/performance.
  201.  
  202. *  supports 64-bit virtual addressing.
  203.  
  204. *  supports multiprocessing.
  205.  
  206. *  scales across multiple IC design technologies.
  207.  
  208. *  provides investment protection (i.e.  100% forward compatible).
  209.  
  210. *  provides openness and adheres to standards.
  211.  
  212. *  supports various operating environments.
  213.  
  214. This goal was achieved by analyzing billions of instructions executed
  215. by application program code acquired from real end users.  This code
  216. was traced and analyzed with innovative instrumentation and techniques.
  217. Starting with a core instruction set, HP scientists strove to strike a
  218. balance, while designing an instruction set that would provide superior
  219. performance in a variety of applications.  As a result, HP's PA-RISC
  220. delivers exceptional price/performance to a wide range of applications.
  221.  
  222. Design methods such as pipelining, superscalar, and superpipelining
  223. (See Appendix A for details) can be used to improve RISC performance.
  224. All 3 methods can, in theory, cover the same range of performance.
  225. Superscalar and superpipelining are more complex than simple
  226. pipelining.  This additional complexity can result in higher costs,
  227. slower time-to-market, and lower reliability.
  228.  
  229. Today, superscalar or superpipelining is not needed to deliver leading
  230. edge performance.  Our current PA-RISC systems are the industry leaders
  231. in performance and price/performance without using any of the more
  232. complex design methods.
  233.  
  234. HP's next generation chip (PA-RISC 7100--available during the Fall of
  235. 1992) uses a simple 2-way superscalar design approach.  This approach
  236. provides the benefits of superscalar while avoiding its complexities.
  237. The new design also integrates the central processing unit and the
  238. floating-point unit on a single chip, replacing the 2 chips found in
  239. current PA-RISC systems.  This will save board space and lower the cost
  240. of future PA-RISC-based systems.  A new 0.8 micron CMOS technology
  241. reduces circuit size and allows HP to design extremely dense chips for
  242. increased processor performance and reliability.
  243.  
  244. HP designed PA-RISC to deliver real and measurable benefits.  The
  245. following are the major benefits:
  246.  
  247. *  Investment Protection--You can be assured of a long architectural
  248. life with PA-RISC.  HP has implemented PA-RISC in high-performance
  249. systems based on TTL, NMOS and CMOS technologies.  Future
  250. implementations currently in our research laboratory include
  251. technologies such as BiCMOS or Gallium Arsenide.  As IC technologies
  252. change, you can be assured your application code will be forward
  253. compatible.  Furthermore, HP's high-end HP 9000 Series 800 Business
  254. Servers and HP 3000 Series 900 Business Systems also offers symmetric
  255. multiprocessing (SMP) capabilities today so users can have more
  256. performance if they need it.  HP's SMP implementation is entirely
  257. transparent to the application which means that existing applications
  258. can benefit from increased performance without any modifications.
  259.  
  260. *  Time and Cost Savings--time to market with RISC systems is faster
  261. because they are easier to design and manufacture.  PA-RISC delivers
  262. true cost savings because HP has eliminated complex processor hardware
  263. and reduced the part count making the system much more efficient, thus
  264. reducing power consumption and cooling requirements.  Another benefit
  265. of the reduced part count is that HP's PA-RISC systems take up less
  266. floor space.  And with less parts, there is less to break, which leads
  267. to increased reliability resulting in less downtime, which means time
  268. and cost savings.
  269.  
  270. .PA
  271. PA-RISC versus Other Competitive RISC Architectures
  272.  
  273. Some significant differences exist between HP's PA-RISC architecture
  274. and other competitive RISC architectures.  The following comparison
  275. will discuss the architectural differences (see Table 1) and their
  276. significance.  Note that Table 2 lists the implementation differences.
  277.  
  278. 1.  Virtual Address Space (Bits):
  279.  
  280. Virtual address space determines the maximum amount of data that can be
  281. used by the system at any given time.  In 1986, HP became the first
  282. company to ship a RISC processor architected for 64-bit virtual
  283. addressing, a feature which has been included in all PA-RISC
  284. processors.  Mips' R4000 and DEC's upcoming ALPHA both offer 64 bit
  285. architectures, but only 42 and 43 bits are implemented in the hardware,
  286. respectively.  IBM offers a 52 bit architecture of which 52 bits are
  287. implemented in the hardware.  Sun only offers a 33 bit architecture of
  288. which 32 bits are implemented in the hardware.
  289.  
  290. A large virtual address space offers flexibility and speed for memory
  291. intensive computing applications.  For example, mapped files,
  292. artificial intelligence, object-oriented databases, and multimedia
  293. (e.g.  voice and video data) applications require large amounts of
  294. virtual address space for optimum performance.
  295.  
  296. Customers will realize and appreciate the flexibility of PA-RISC as
  297. applications become more memory intensive.  Computer scientists have
  298. estimated that virtual address space requirements double every year.
  299. According to this prediction, PA-RISC should maintain a high
  300. performance level far into the future.
  301.  
  302. 2.  Maximum Segment Size (Bits):
  303.  
  304. Related to the virtual address space is segment size.  With the PA-RISC
  305. and SPARC architectures the segment size is 32 bits.  In other words,
  306. each user (or process) is an assigned segment (or section of memory) of
  307. up to 4 GB (2 to the 32 power).  The POWER architecture supports 28
  308. bits.
  309.  
  310. The Mips and ALPHA architectures use an unsegmented 64-bit address
  311. space.  Using this method, users can be allocated more than 4 GB of
  312. space if needed.  Today, very few applications need this much space.
  313. Even in situations where more than 4 GB is needed, PA-RISC will assign
  314. multiple segments to that process, although some performance overhead
  315. is required to switch between the segments.
  316.  
  317. .PA
  318. 3.  General Purpose Registers:
  319.  
  320. On RISC processors, registers are utilized to hold intermediate
  321. computational results minimizing slow memory access.  HP's extensive
  322. simulations have shown that 32 registers is the optimum number.  Any
  323. greater number of registers reduces performance by increasing CPU cycle
  324. time without a compensating decrease in instruction path length.
  325.  
  326. SPARC is based on the idea of overlapping register windows.  Currently,
  327. SPARC implementations use 120 registers to support 7 windows.  At any
  328. instant, a program can access only one window, or 32 registers.  This
  329. approach can present performance problems in multiuser environments.
  330. As the number of users on a system increases from a single-user
  331. environment, windows-based architectures face an increasing need to
  332. save and restore their large number of registers.  This intensifying
  333. need for register management increases system overhead and reduces the
  334. proportion of processor resources that can be allocated to user
  335. processes.  Also, SPARC's large number of registers require extensive
  336. silicon area to implement.  This can increase problems for any
  337. implementation.  Scalability is also a problem due to the difficulties
  338. in migrating SPARC to newer, higher performance technologies.  A larger
  339. than necessary register set also contributes to longer (i.e., slower)
  340. cycle time.
  341.  
  342. PA-RISC, POWER, Mips, and ALPHA all use 32 general purpose registers.
  343. This requires far less silicon area, allowing room for other functions
  344. and features like caching and an enhanced instruction set that
  345. contribute more directly to faster application processing.
  346.  
  347. 4.  Floating Point and Integer Registers (Bits):
  348.  
  349. There is a growing trend in technical applications toward highly
  350. accurate double-precision (64-bit) calculations.  PA-RISC, POWER, Mips,
  351. and ALPHA use 64-bit floating point registers and can perform double-
  352. precision operations very quickly.  These registers can store very
  353. large numbers and can perform calculations with extremely high
  354. accuracy.  SPARC has only 32-bit floating point registers.
  355.  
  356. PA-RISC, POWER, and SPARC use 32-bit integer registers, while Mips and
  357. ALPHA use 64-bit registers.  These 32-bit registers can store values as
  358. large as 4,200,000,000.  HP has found that customers who work with
  359. numbers even larger than this use the floating point unit.  Therefore,
  360. there is no need to add the extra cost of larger integer registers.
  361. The PA7100 chip can perform 64-bit floating point calculations in just
  362. 2 clock cycles, so there is little penalty (and often a significant
  363. speedup) for doing precise calculations on the floating point side.
  364.  
  365. .PA
  366. 5.  Binary Coded Decimal (BCD) Support:
  367.  
  368. PA-RISC includes features for efficient BCD support.  POWER, Mips,
  369. SPARC, and ALPHA offer no similar support.  PA-RISC was designed for
  370. commercial applications where BCD support is very important.  For
  371. example, COBOL programs frequently use BCD data in arithmetic
  372. calculations.  Therefore, support of BCD translates into increased
  373. commercial performance for PA-RISC.  POWER, Mips, SPARC, and ALPHA's
  374. must generate longer instruction path lengths in order to deal with
  375. these instructions, which may limit their commercial performance and
  376. applicability.
  377.  
  378. 6.  Combined Operation Support:
  379.  
  380. PA-RISC can execute a test-and-branch operation with 1 instruction.
  381. POWER, Mips, SPARC, and ALPHA execute a test-and-branch operation with
  382. 2 instructions.  Since 15% to 20% of all instructions encountered in a
  383. typical program execution are test-and-branch, performance drops when
  384. code is doubled.  With PA-RISC, this feature alone delivers a 10% to
  385. 15% performance advantage over competitors.  Other combined operations
  386. (e.g., add-and-branch, load-and-increment, floating-point-add-and-
  387. multiply) provide a total of 30% performance advantage over less
  388. powerful architectures such as Mips, SPARC, and ALPHA.
  389.  
  390. 7.  Unaligned String Support:
  391.  
  392. PA-RISC selectively stores 1 to 4 bytes from a register allowing simple
  393. handling of unaligned strings.  Unaligned strings consist of sections
  394. of stored data that must be transferred to another location in a
  395. database and then shifted to the left or right without affecting other
  396. bytes within a register.  Mips, SPARC, and ALPHA have to combine many
  397. different instructions to accomplish this task.
  398.  
  399. PA-RISC's ability to support unaligned strings is important because
  400. most strings are short (i.e., partial words).  These partial word
  401. stores and shifts are common in database and COBOL applications.
  402. Therefore, since PA-RISC can store partial words in one machine cycle,
  403. the processor has a speed advantage over many other RISC
  404. implementations in commercial applications.
  405.  
  406. .PA
  407. 8.  Memory Protection Levels:
  408.  
  409. Unlike single-user systems, multiuser systems require security from
  410. unauthorized access to sensitive files and programs.  Protection is
  411. necessary to prevent loss or corruption of data.  PA-RISC has a
  412. hardwired memory protection system which provides 4 privilege levels.
  413. PA-RISC offers vertical protection for "public" data across 4 different
  414. levels and horizontal protection for "private" data at each level.
  415. Calls to subsystems of limited privilege are allowed through
  416. "gateways," without passing through the most privileged level.  This
  417. architected framework provides the foundation necessary for efficient,
  418. well secured multiuser systems.
  419.  
  420. POWER, Mips, SPARC, and ALPHA provide a limited protection scheme
  421. consisting of 2 privilege levels (i.e.  user and supervisor modes).
  422. With this scheme, a trap will cause an entry to supervisor mode.  There
  423. is no other architectural protection.  This protection model is so
  424. simple that secure multiuser systems will be difficult to implement
  425. without considerable software overhead.
  426.  
  427. PA-RISC is one of the only RISC architectures that incorporates this
  428. feature.  This offers extra assurance that the hardware and software
  429. can be accessed by only the appropriate people.
  430.  
  431. .PA
  432. Conclusion
  433.  
  434. Although HP's PA-RISC and IBM's POWER, Mips' Mips, Sun's SPARC, and
  435. DEC's ALPHA have been developed with RISC concepts, major design
  436. differences exist.  These architectural differences are due in part to
  437. the design approaches utilized by HP, IBM, Mips, Sun, and DEC computer
  438. engineers.  HP's PA-RISC is a result of a rigorous analysis of real
  439. customer code from a variety of application areas.
  440.  
  441. In summary, HP's PA-RISC has been carefully developed to provide the
  442. following architectural advantages.
  443.  
  444. *  PA-RISC is a flexible architecture providing exceptional performance
  445. across a broad range of applications in commercial, engineering, and
  446. scientific environments.  None of the other RISC vendors can match our
  447. capabilities either from a performance perspective or from a
  448. flexibility perspective.
  449.  
  450. *  PA-RISC's large virtual address space is capable of meeting today's
  451. accelerating memory requirements as well as meeting the demands of
  452. memory intensive applications such as object-oriented databases,
  453. artificial intelligence, and image processing.  HP was the first
  454. supplier to design a 64 bit architecture.
  455.  
  456. *  PA-RISC does not use a flat 64-bit virtual address space because the
  457. segmented method is less expensive.  PA-RISC uses a cost-effective
  458. "segmented" approach to deliver 64-bit functionality.  Customers do not
  459. pay for 64-bit features they do not need.
  460.  
  461. *  PA-RISC's 32 general purpose registers require far less silicon area
  462. than SPARC's register window approach, allowing room for other
  463. functions and features like caching and an enhanced instruction set
  464. that contribute more directly to faster application processing.
  465.  
  466. *  PA-RISC directly supports binary-coded decimal (BCD) and string
  467. operations frequently used in commercial languages such as COBOL, which
  468. leads to higher commercial performance.
  469.  
  470. *  PA-RISC's combined operation support provides a single-cycle
  471. solution which greatly reduces path lengths (i.e., increases
  472. performance).
  473.  
  474. *  PA-RISC's comprehensive protection scheme offers a higher degree of
  475. security for multiuser systems.
  476.  
  477. .PA
  478.  
  479. ..picturec:\risc\conc.gal,65535,49151,16,65,17,
  480.  
  481. .PA
  482. Appendix A--RISC CPU Architectural Capabilities
  483.  
  484. 1.  SUPERSCALAR
  485.  
  486. The term superscalar (derived from scalar, meaning "one-dimensional",
  487. thus superscalar meaning "multi-dimensional") refers to a design
  488. incorporating multiple execution units, each capable of executing an
  489. instruction simultaneously.  For example, this may be implemented as an
  490. integer unit and a floating point unit, each of which can begin an
  491. instruction in the same clock cycle.  This contrasts with most
  492. processors which may have both integer and floating point units but can
  493. begin only one instruction at a time.
  494.  
  495. While the ability to perform two or more instructions per cycle can be
  496. an advantage, current superscalar processors often have restrictions on
  497. the type of instructions that can be accepted in the same clock cycle.
  498. These processors can only accept one instruction from column "A" and
  499. one from column "B" on each cycle.  If a program wishes to execute two
  500. instructions from column "A", they must be done one after the other,
  501. just like a scalar processor.  Thus, the performance of such restricted
  502. superscalar processors will vary widely from application to
  503. application, depending on the mix of instruction types.  These
  504. processors also require additional circuits to check for and handle the
  505. various combinations of instruction types, and special compilers which
  506. rearrange program instructions to create opportunities for parallel
  507. execution.
  508.  
  509. 2.  PIPELINING AND SUPERPIPELINING
  510.  
  511. The term "pipelining" is widely but not consistently used.  Most high-
  512. performance CPUs today are "pipelined", which means that they execute
  513. instructions in a series of steps (or "stages").  This allows a number
  514. of instructions to be overlapped, with each instruction in a different
  515. stage.  For example, a simple three stage pipeline is shown below.
  516.  
  517. ..picturec:\risc\pipe.gal,65535,49151,17,60,15,
  518.  
  519. The sole benefit of pipelining is to reduce the cycle time of the
  520. processor.  The cycle time (the inverse of clock frequency) of a
  521. processor can be represented as the GATE DELAY X CRITICAL GATES.  The
  522. gate delay (in nanoseconds) is determined by the IC process, and the
  523. critical gate length is the longest sequence of logic gates needed to
  524. execute any pipelined stage.  For a particular IC process, cycle time
  525. can be decreased only by dividing instruction execution into multiple
  526. pieces, each requiring a smaller number of gates.
  527.  
  528. The challenge of pipelined designs is that the CPU must look for and
  529. resolve situations where one instruction in the pipeline needs
  530. information from another instruction which has not yet finished.
  531. Depending on which pipeline stages the two instructions are in, these
  532. situations are handled by "bypassing" (similar to a handoff in a relay
  533. race) or by "stalling" (where one instruction waits for the other to
  534. complete).  Bypassing requires additional circuitry, while stalling
  535. slows down the processor.  In addition, the number of possible
  536. combinations of stages increases the circuit complexity and schedule
  537. delays.  Many current CPUs use a 4- or 5-stage pipeline to minimize the
  538. number of these interactions.
  539.  
  540. Superpipelining is an extension of pipelining techniques to very long
  541. pipelines.  In principle, superpipelined CPUs have the potential for
  542. shorter cycle times because of the additional stages that they support.
  543. However, the increased number of stages creates more potential for
  544. interactions which require the added costs of bypassing or performance
  545. penalties of stalls.
  546.  
  547. .PA
  548. Glossary
  549.  
  550. Architecture--The unique set of machine instructions that provides the
  551. conceptual basis of a computer.
  552.  
  553. Cache--Fast memory connected directly to the CPU.  Generally, systems
  554. with larger caches are usually faster because more of the program
  555. information can be kept in the cache rather than in the slower main
  556. memory.
  557.  
  558. Clock Cycle--The smallest unit of time used by a processor.  This time,
  559. based on the clock signal, is used to synchronize the various processor
  560. circuits.  The actual cycle time varies for different processors; the
  561. higher the clock frequency, the shorter the cycle time.
  562.  
  563. COBOL (COmmon Business Oriented Language)--A high-level programming
  564. language with similarities to English.  COBOL is used primarily for
  565. business applications.
  566.  
  567. Compatibility--The ability of software developed on one machine to work
  568. on another.
  569.  
  570. Complex Instruction Set Computing (CISC)--An architecture that uses
  571. microprogramming and complex instructions.
  572.  
  573. Control Store--A special, high-speed device used to store
  574. microinstructions in a microprogrammed architecture.
  575.  
  576. Coprocessor--A special purpose processor that works with the CPU to
  577. speed up specialized operations such as floating-point arithmetic and
  578. graphics processing.
  579.  
  580. Floating point--An instruction which performs a scientific math
  581. calculation.  Floating-point applications generally contain a mix of
  582. integer and floating-point instructions.
  583.  
  584. Hardwired--A type of computer on which the instruction set is
  585. implemented directly on the CPU chip.
  586.  
  587. Implementation--The actual hardware structure of the computer.  An
  588. architecture can be implemented in several different circuit
  589. technologies.
  590.  
  591. Instruction Set--The set of all possible machine instructions which can
  592. be understood or executed by the computer.  The instruction set defines
  593. the computer architecture.
  594.  
  595. Integer--An instruction or application which performs only simple
  596. calculations on small numbers.  Integer applications contain no
  597. floating-point instructions.
  598.  
  599. Integrated Circuit (IC)--A single semiconductor device containing a
  600. large number of circuits.  The density of circuits on a chip is
  601. described in degrees of integration:  Large-Scale Integration (LSI) and
  602. Very Large-Scale Integration (VLSI), etc.
  603.  
  604. Machine Cycle--The period of time required by a computer to perform the
  605. most fundamental operation.
  606.  
  607. Main memory--A device capable of storing information in a binary form.
  608. Usually accessed by the processor through a memory interface chip.
  609.  
  610. Optimizing Compiler--A sophisticated compiler that intelligently
  611. translates High-Level Language programs by removing inefficiencies and
  612. unnecessary instructions.  With an optimizing compiler, a program will
  613. run faster and use less memory.
  614.  
  615. Pipelining--A design whereby several machine instructions are processed
  616. or executed simultaneously.
  617.  
  618. Program--The set of commands that tell a computer what to do.
  619.  
  620. Real Address Space--The group of addresses used by the main memory.
  621. The size of this space is limited by the CPU.
  622.  
  623. Reduced Instruction Set Computing (RISC)--An architecture that features
  624. a simplified, hardwired instruction set.
  625.  
  626. Registers--Small, high-speed devices within the Execution Unit of the
  627. CPU where information is held temporarily.
  628.  
  629. Superpipelining--See Appendix A.
  630.  
  631. Superscalar--See Appendix A.
  632.  
  633. Virtual Address Space--The group of all unique memory addresses
  634. assigned to all program data and instructions being used by a system at
  635. any time.  Virtual addresses are used to keep track of this information
  636. as it moves between main memory and disk.  The size of this space is
  637. limited by the CPU.
  638.  
  639.  
  640. .PA
  641. Table 1:  PA-RISC Architecture Feature Comparison
  642.  
  643.  
  644. FEATURE                      HP's      IBM's      Mips'   Sun's   DEC's
  645.                              PA-RISC   POWER      RX000   SPARC   ALPHA
  646. -----------------------------------------------------------------------
  647.  
  648. Virtual Address Space (Bits) 64        52         64      33      64
  649.  
  650. Maximum Segment Size (Bits)  32        28         62      32      62
  651.  
  652. General Purpose Registers    32        32         32      120     32
  653.  
  654. FP/Integer Registers (Bits)  64/32     64/32      64/64   32/32   64/64
  655.  
  656. Binary Coded Decimal Support Yes       No         No      No      No
  657.  
  658. Combined Operation Support   Yes       Limited    No      No      No
  659.  
  660. Unaligned String Support     Yes       Yes        No      No      No
  661.  
  662. Memory Protection Levels     4         2          2       2       2
  663.  
  664.  
  665. .PA
  666. Table 2:  PA-RISC Implementation Comparison
  667.  
  668.  
  669. FEATURE                      HP's      IBM's   Mips'  Sun's   DEC's
  670.                              PA-RISC   POWER   R4000  SPARC2  ALPHA
  671.                              (PA7100)                         (EV-4)
  672. -----------------------------------------------------------------------
  673.  
  674. Clock Frequency (MHz)        100        50      50     40      150-200
  675.  
  676. Virtual Address Space (Bits)  48        52      42     33       43
  677.  
  678. Maximum Segment Size (Bits)   32        28      41     32       39
  679.  
  680. Physical Address (Bits)       32        32      36     36       34
  681.  
  682. Cache Size Maximum (MB)       3       .064       4   .256        8
  683.  
  684. TLB Size (Entries)            136      160      64     64       48
  685.  
  686. Superscalar                   Yes      Yes      No     No      Yes
  687.  
  688. Superpipelined                No        No     Yes     No      Yes
  689.  
  690. Maximum CPU Performance
  691. (SPECmarks/second)           >120*     100      70     24     >120**
  692.  
  693. SPECmark/MHz                  1.2      2.0     1.4    0.6      0.7
  694.  
  695.  
  696. *   estimated by HP
  697. **  estimated by DEC
  698.